2次元散布図の使い道は、 関係のグラフ として使う場合と、 2次元分布を表すグラフとして使う場合があります。
1次元散布図 のページがあるため、 タイトルは、「2次元散布図」にしましたが、 一般的に「散布図」と言えば、2次元のものを言っていることが多いです。
強みは、すべてのデータをプロットしますので、個々のデータの具体的な位置や値をチェックするのに向いていることです。
外れ値が目立ちやすいので、 外れ値の判定 でも重宝します。
データがある程度以上に、密集してしまう領域については、 「密集している」ということがわかるだけで、密集の度合いがわからないことです。 そのため、データが多い時には、うまく使えないことがあります。
ヒートマップ
を使った2次元の
ヒストグラム
や密度分布の方が良いことがあります。
下のグラフは、散布図、2次元ヒストグラム、密度分布の順です。
散布図は、Excelでも簡単に作れますが、 層別のグラフ は手間がかかります。 層別のグラフ は ggplot2 、 seaborn という グラフ統計のソフト があります。
Plotly だと、データの密集している部分を拡大する分析が簡単にできます。
順路 次は 言葉の散布図